#AI 員工
世界經濟論壇最新發佈《執行中的人工智慧代理:2025 年評估和治理基礎》:企業如何讓 AI agents 既強大又可靠?
在 AI 技術迅猛發展的當下,AI agents(人工智慧代理)正從實驗室原型走向企業實戰,成為提升效率的“數字員工”。然而,如何讓這些“智能助手”既強大又可靠?世界經濟論壇(WEF)與Capgemini攜手發佈的《AI Agents in Action: Foundations for Evaluation and Governance 2025》(人工智慧代理在行動:2025年評估和治理基礎)白皮書,給出了實用答案。這份報告為決策者、技術領袖和從業者量身打造的“行動手冊”,幫助大家從實驗到部署,一步步建構安全、可信的 AI agents 生態。AI agents:從“聊天機器人”到“決策夥伴”的躍遷在呼叫中心,過去是指令碼化的聊天機器人,現在是能理解意圖、動態決策的AI agents;在企業流程中,它不再是靜態工具,而是像人類同事一樣規劃任務、呼叫資源。報告前言中,Capgemini Invent首席執行長Roshan Gya和WEF人工智慧卓越中心負責人Cathy Li 表示:AI agents 的興起將帶來效率飛躍、人機互動革新,甚至催生全新數字生態。但機遇伴隨挑戰——目標錯位、行為漂移、工具濫用等風險,正考驗著傳統軟體治理的極限。這份報告的核心洞見是:AI agents 不是簡單升級,而是範式轉變。它借鑑人類入職流程——定義角色、測試表現、逐步授權——強調“最小特權原則”,即只賦予必要權限。報告調研顯示,目前多數企業還停留在規劃或試點階段,這正是“從小處起步、迭代謹慎、防護適度”的最佳時機。如果貿然推進,未經驗證的用例可能釀成信任危機。報告建議:通過跨職能協作和漸進治理,讓AI agents放大人類智慧,推動創新,提升生活品質。技術基石:建構可靠的 AI agents 架構AI agents的軟體架構、通訊協議和安全模型,直接決定了它們如何融入組織、與世界互動。就像招聘新員工,企業需為AI agents搭建“工作站”——清晰角色、防護機制、監督體系。AI agents的架構分為三層:應用層、編排層和推理層。簡單說,應用層是“門面”,通過使用者介面或API接收輸入,確保輸出符合業務需求,可在雲端或邊緣裝置運行。編排層像“項目經理”,協調工具呼叫、子代理分工,支援模型切換(根據任務複雜度選大模型或小模型),並通過Model Context Protocol(MCP)連接企業資源,如資料庫或CRM系統。這層讓AI agents擺脫供應商鎖定,實現多雲多邊環境的無縫協作。最有趣的是推理層:它驅動AI agents的“思考”——從規則邏輯到生成式模型,處理預測、分類或規劃。報告用圖示說明:這些層協同工作,形成動態邊界,確保AI agents在安全圍欄內行動。舉例來說,在多代理系統中,A2A(代理間協議)和ACP(代理連接協議)讓它們像團隊一樣協作,處理複雜依賴。報告強調,建構AI agents不止工程,還需orchestration(編排)。它融合四種範式:經典軟體的確定邏輯、神經網路的模式識別、基礎模型的上下文適應,以及自主控制的規劃機制。這讓AI agents從“執行命令”進化到“自主決策”,但也引入新複雜性——需結構化腳手架,避免行為失控。通訊與安全:讓 AI agents “對話”無障礙協議是AI agents的“通用語言”。報告重點介紹2024年底Anthropic推出的MCP,它標準化了代理與資料來源、API的連接。過去,每個代理任務需定製整合;現在,MCP如共享介面,讓代理輕鬆查日曆、讀郵件、更新資料庫。報告圖示生動:代理A發郵件更新記錄,代理 B 確認資料庫變更,整個過程高效模組化。MCP已獲主流框架支援,被視為連接代理與企業基礎設施的核心。它加速部署,支援即插即用,尤其在雲、邊緣和感測器資料場景。另一協議A2A則專注代理間互動,形成multi-agent systems(MAS)的互操作層。報告展望:這些協議將讓AI agents在雲平台、企業網和邊緣裝置間自由流動,開啟即時感測器驅動的智能時代。安全不容忽視。AI agents架構獨特,能越過組織邊界呼叫外部工具,這帶來網路安全新憂。報告建議:視AI agents為“擴展員工”,用人類治理邏輯——權限漸增、行為測試、人機環路——管理風險。傳統存取控制已不足,需關注自治、權威和上下文,確保可靠邊界。分類與評估:從角色定義到風險把控報告第二部分轉向實用:如何分類、評估和治理 AI agents?它提出功能分類框架,按角色、自治度、權威、可預測性和營運上下文區分代理。這不是抽象標籤,而是指導評估與防護的藍圖——任務範圍小、環境可控的代理,防護可輕;高自治、高影響的,則需嚴謹審查。評估是關鍵。報告建議:用驗證案例測試行為,在人機環路中運行,逐步擴展自治。風險評估聚焦新威脅,如目標錯位或協調失效,借鑑OECD、NIST、ISO/IEC框架,擴展自治與系統風險原則。報告強調漸進治理:從小規模起步,迭代最佳化,連接評估與防護,確保信任、安全與問責。展望未來:多代理生態的曙光報告結尾展望多代理生態:代理間協作將催生複雜生態,如分佈式決策網路。但需警惕 emergent risks(湧現風險)。通過 AI 治理聯盟的協作,報告建議:從小做起,建好基礎,為更廣闊應用鋪路。 (AI資訊風向)
被裁的亞馬遜普通員工,怒懟AI
上月底,亞馬遜啟動了近年規模最大的一輪裁員,約14000個崗位被直接削減。這並非一場常規的降本增效,而是一輪面向AI時代的組織重構。對許多一線員工而言,真正的危險不是績效下滑,而是崗位本身正被系統性稀釋。亞馬遜CEO今年強調“Use AI or Bye-bye”。公司計畫將更多資源加速投入到AI基礎設施、大模型、雲端運算及自動化系統中。隨之而來的,是大量原本支撐跨境電商、國際零售和中後台營運的崗位,被壓縮、合併,甚至直接消失。在這一背景下,裁員邏輯變得簡單而冷硬:不是你不夠努力,而是你的崗位已不再被需要。面對AI,那些過去依靠經驗、溝通、流程和耐心維繫的普通崗位,正逐漸失去支點,被悄然移出職場版圖。我們對話了三位被“一鍵清退”的亞馬遜基層員工。相比財報與公告中的冷資料,他們的講述更貼近地面。從裁員郵件降臨的一刻,到系統帳號被瞬間註銷;從AI工具的真實使用體驗,到安穩感被擊碎的瞬間——在這些細節裡,一場工業級的AI轉型,變得具體、冰冷,也更加接近普通人的真實命運。上一秒還在對接客戶,下一秒被裁了得知自己被裁員那一刻,李明嵐正在加班。10月28日傍晚,她正對著電腦核對客戶資料。“叮”一聲,右下角彈出一封新郵件。標題很短,沒有多餘修飾。她愣了幾秒,才意識到,那是一封裁員通知。李明嵐從事電商行業近10年,入職亞馬遜擔任客戶經理一年多來,績效排名始終靠前。裁員名單中突然出現自己的名字,讓她一時難以回神。她立刻告訴兩位上級領導,但對方同樣一臉錯愕。除了表示驚訝與惋惜,他們也無法提供更多資訊。據稱,他們也是從前一天的媒體報導中才得知裁員消息,對具體安排並不知情。想到仍有客戶在等待回覆,李明嵐回到電腦前打算處理交接,並逐一向客戶道別。系統卻彈出提示:“您已無法登錄。”沒有交接,沒有過渡。她手中未完的項目和問題,就此戛然而止。圖 | 接到裁員郵件後,系統帳號很快就被註銷“快到甚至不需要交接。”在李明嵐看來,這次裁員更像一場迅速而徹底的清算。國內商務崗基層員工劉令一,也在這場裁員中一夜出局。在他的經驗中,公司以往裁員遵循“PIP機制”——績效尾部淘汰。流程包括書面通知、領導及HR約談,再到數月評估緩衝,被裁員工通常有兩個月左右的周旋期。但這一次,從收到裁員郵件到與HR確認賠償方案,劉令一隻用了不到48小時。曾經讓人避之不及的HR約談,這幾天成了需要搶位的稀缺資源。由於涉及人數眾多,HR行程排滿,劉令一在收到郵件後立即預約,才擠進了第二天下午的空檔。會議室裡,一名素未謀面的主管與一名HR直接宣讀裁員結果,並提供三種賠償方案,全程幾乎沒有寒暄。明明沒有外籍人員在場,對話卻全程使用英文。劉令一覺得,這種難以說明緣由的“硬裁”,似乎更適合用一種非母語完成。他對這份工作本就沒有強烈留戀,但面對冷靜而程式化的話術,仍感到不適。會議桌上的檔案,字字句句似乎都與公司反覆強調的“領導力準則”形成微妙反差。“成為全球最好的僱主,關注員工成長與發展。”他在心裡默念,簽下了名字。受衝擊更大的,是林夢穎這類員工。在國內網際網路大廠經歷三年高壓工作後,林夢穎於去年底入職亞馬遜中國,擔任電商營運。不到一年,她第一次感受到所謂的“work-life balance”:每周三天到崗,六點下班,雙休,團隊節奏穩定,沒有強烈內卷。她將這裡視作一處“修復空間”,開始恢復運動、閱讀和社交節奏,並與男友計畫未來,相信這份相對穩定的崗位可以支撐更長遠的生活。10月27日,是林夢穎的生日。晚上,她正舉起手機準備給蛋糕拍照,螢幕突然彈出一封公司郵件。她以為是節日祝福,點開後才發現是領導預告即將裁員的通知。“裁員賠償大禮包”,成了今年最突兀的生日禮物。更意外的是,她所在的小組整體被裁,相關業務線在全球範圍內同時撤除。對於一些跨境工作的員工而言,裁員還意味著簽證、居留和生活安排的連鎖變化。社交平台上,關於此次裁員的討論持續發酵。一位網名為“小戶裡的小布”的新員工形容,這輪裁員像“滅霸的響指”。“不看績效,只為消滅人口”,他寫道。與AI鬥智鬥勇大半年,最終被幹掉實際上,在裁員消息公佈之前,亞馬遜內部早已出現過“預警”。6月底,李明嵐收到一封系統郵件,附上了CEO安迪·賈西在公司官網發佈的一篇長文。密密麻麻的英文中,“AI”幾乎每隔幾行就出現一次。從基礎設施、大模型,到雲服務、電商和物流應用,亞馬遜今年展開了有史以來最大規模的技術投入。1000個人工智慧相關的項目正在開發,公司物流倉儲、雲服務、電商業務等都正在被AI重塑。滿屏都是與AI相關的雄心壯志。在文章結尾處,賈西寫道:隨著AI效率的提升,未來幾年公司員工規模將隨之縮減。當時看到這句話,李明嵐並未放在心上。AI取代人,是一種被講了太多年的“未來命題”。直到裁員郵件彈出,她才反應過來:原來,未來這麼快就來了。這輪裁員,安迪·賈西的公開說法是,為適應AI技術變革,將資源進一步集中至人工智慧相關領域。“Use AI or Bye-bye”是他掛在嘴邊的企業新口號。這場“All in AI”的轉向,其實從年初起,劉令一就已感知到。公司內部網路陸續上線AI搜尋外掛和辦公工具,鼓勵“全員開發”,員工可以使用內部平台搭建自己的AI應用。部門還要求在每周例會上分享AI使用場景,輪流講述“如何用AI為業務提效”。但在劉令一看來,這更像一項行政任務。聽說有同事開發了一款生成銷售話術的智能體,他只覺得是“紙上談兵”。商務工作本質上是一種高頻互動。對接中小賣家,談判、維繫關係,靠的是情商、語境判斷和即時反應。而AI生成的話術往往生硬、範本化,很難真正嵌入真實的商務場景。同事們心照不宣,默認在核心業務上與AI保持距離。一次聚餐中,有同事向劉令一抱怨:“鼓勵用AI提效,說白了,不就是讓我們加速被替代。”焦慮之下,周會裡的“AI分享”更多淪為PPT美化、資料整理,真正能直接進入業務鏈條的場景,少之又少。但在季度匯報節點,部門又被要求配合領導,設計一套“AI賦能業務”的方案,對上匯報。讓底層員工設法用AI提效,更像一種自上而下的焦慮傳導。7月底,亞馬遜召開第二季度財報電話會議。CEO安迪·賈西遭受了電話另一頭的輪番拷問。亞馬遜雲服務營收增速遠低於微軟和Google、人工智慧領域的發展也落後於競爭對手。在投資人輪番追問中,賈西試圖用宏大的AI藍圖穩住情緒。但會後,AWS股價在盤後交易中下跌7%。顯然,資本並未完全買帳。亞馬遜還需要講出更能讓市場信服的AI故事。然而這場AI浪潮,在基層員工這裡,並未形成真正的共振。林夢穎忙不過來時,也會用公司AI工具輔助分析廣告資料。但從輸入指令、生成結果再到人工覆核,流程複雜,效率提升有限。而且AI不瞭解具體商家背景,結論常常流於表層。她給這個系統打的分數是“60分”。這讓她產生一種錯覺,AI短期內無法替代自己。李明嵐也有類似判斷。她認為,客戶是否出席活動,往往取決於長期信任和人際關係的積累。即使公司AI系統能答業務問題,但人與人之間的連接,機器無法取代。只是從公司整體視角看,這些價值微乎其微。根據2024年亞馬遜財報,國際零售業務營收約佔22%,利潤只貢獻約5.5%;而云服務業務雖僅佔總營收約17%,卻貢獻了近60%的營業利潤。今年,亞馬遜計畫投入超1000億美元加碼AI領域,傳統業務的戰略權重進一步下滑。在AI浪潮下,個體在業務鏈中的價值被稀釋成可隨時替換的變數,在系統化裁剪面前顯得可有可無。李明嵐們曾努力維繫的崗位、積累的經驗與信任,在一夜之間被結構化淘汰。系統生鏽,螺絲釘背鍋帳戶被公司系統一鍵註銷後,李明嵐努力保持平靜。她感覺這種不快就像一個原本自己也並不痴迷的人,突然甩了自己。作為客戶經理,李明嵐的日常被電商平台上各種瑣碎問題圍繞,其中最常遇到的是客戶資質稽核。8月初,一位服裝零售客戶發來求助。李明嵐打開稽核系統,卻提示依舊模糊:“請核實提交資料的完整性”,她頓感頭疼。在亞馬遜,為了過濾風險帳戶,跨境電商需要不定期接受資格審查,內容包括賣家身份、經營資質、財務狀況等。稽核系統高度自動化,演算法能敏銳判定合規與否,卻難以解釋具體原因。通常,這類問題交由公司統一負責的部門處理。客戶經理能做的,往往只是將客戶情況整理成郵件上報。面對“演算法黑箱”,對面的回應,也多是:“請客戶重新上傳檔案。”接下來的幾周,李明嵐陪客戶反覆試錯:壓縮圖片、修改註冊資訊、重新掃描帳單,甚至調整掃描清晰度,如此循環再提交。直到月底的一次系統刷新,提示忽然變為“稽核通過”。客戶連聲道謝,而李明嵐卻笑不出來——問題的解決並非源自自己,也許是演算法更新了參數,也許是模型重新訓練。她能起的作用,僅是“提供情緒價值”,耐心回覆客戶的疑問,並安撫焦慮情緒。最初加入亞馬遜時,她期待在新領域積累業務能力,但這種耗費精力卻難有收穫的日常,不斷削磨她的底氣。系統架構帶來的結果,是基層員工不得不承擔的“副作用”。李明嵐及部門的績效與客戶營業額直接掛鉤。客戶因稽核問題暫停交易,損失的銷售額同樣會被模型算出,而後精準扣在業績上。那個月,她還有兩位客戶的店舖因同樣問題關停,績效免不了下滑。在這個全球規模龐大的跨境電商平台裡,資訊高效流通本就不易,這也是劉令一日常困擾所在。在亞馬遜工作的這段時間,他使用過三套內部通訊工具,有時為開會要在三個平台輪番通知。公司沒有統一的OA系統,需要檢索內部網路或依靠零散文件獲取資訊。郵件仍是日常溝通的主管道。一次上門拜訪客戶時,劉令一被客戶指向新上線的功能,詢問具體操作。面對陌生的功能名稱,他低聲應了兩句,裝作淡定:“我得跟團隊確認一下,再告訴您。”事實上,他完全不知何時上線,也不清楚細節。平時,他清楚的僅是自己明確的KPI,對項目全景和產品體系理解有限。幾次向直屬領導提出疑問,得到的回答也模糊不清,資訊量並不多。與他們相比,林夢穎更像一隻在實驗項目裡的“小白鼠”。去年底,她從國內頭部大廠跳槽,進入亞馬遜中國的一個新型電商客戶項目組。此前投遞過亞馬遜職位未果,這次意外被HR在人才庫中發現。面試時,她在兩天經歷了六輪考核。與以往不同,面試官更關注她與“領導力準則”下企業價值觀的契合度,而非過去經歷的細節。這讓林夢穎感受到,公司對員工能力的包容度更高,而非“即來即用”。加上對外企“不卷”“自由度高”的印象,她接下了offer。即便降薪、無年終獎、缺少食堂或健身房等“大廠待遇”,她依然覺得值得嘗試。入組後,鬆弛氛圍超過預期。前兩個月,她幾乎沒有正式任務,主要在系統上學習崗位知識。遇到困難,向同事請教,總能得到耐心而細緻的解答。在此前的工作經歷中,林夢穎一直感受同級間暗自較勁。而在這裡,她幾乎沒有壓力感。並非亞馬遜所有項目組都如此鬆弛,在裁員前,她曾一度覺得這份工作理想得有些不真實。直到得知該項目將在全球撤裁,林夢穎意識到,這或許本身就是一場業務實驗,而那些曾讓她覺得不真實的鬆弛感,也終於有了答案。圖 | 大裁員的同時,亞馬遜依舊在招聘AI人才裁員同步進行的,是招聘。社交平台上,一條亞馬遜營運崗招聘帖寫著:“會用AI就行。”亞馬遜這艘大船仍在航行,只是改了航向。而那些基層員工,則成了隨時可能被卸下的艙內貨物。 (虎嗅APP)
AI革命下一站:Anthropic與OpenAI斥巨資打造“虛擬員工”
9月17日消息,AI領域的兩大巨頭Anthropic和OpenAI正致力於開發能夠替代人類執行複雜工作的“AI同事”。其核心方法是使用模擬企業軟體來訓練AI模型,使其能像人類員工那樣理解和操作真實的工作流程。為加速這一處理程序,Anthropic計畫在明年投入10億美元建設大規模的AI訓練“健身房”。OpenAI則認為,整個經濟未來都可能變成巨大的“強化學習機器”,AI將通過與人類協作和反饋不斷進化,從根本上重塑生產力與工作模式。時薪最高250美元 “AI家教”正在教大模型如何辦公Anthropic與OpenAI正在做一件前所未有的事:讓大語言模型真正走進“辦公室”,學習當一名合格的“數字員工”。這些AI模型正在接受高強度職業培訓,學習操作各類專業辦公軟體,從Salesforce的客戶管理系統、Zendesk的客服平台,到醫療領域的Cerner電子病歷系統。最終目標是讓AI能夠獨立處理白領日常面臨的複雜工作任務。與傳統AI訓練完全不同,Anthropic和OpenAI這次採用的是“模擬辦公”沉浸式教學。研究人員不僅為AI搭建高度模擬的企業應用環境,還重金聘請各行業專家擔任“職業導師”,手把手教授模型軟體操作技巧。這樣的訓練成本不菲。據知情人士透露,Anthropic計畫在未來一年內投入10億美元,專門建設被稱為“強化學習環境”或“健身房”的模擬辦公平台。OpenAI同樣不惜重金,預計今年在資料相關領域的支出就將達到10億美元,到2030年更將增至80億美元。這些資金既用於搭建虛擬辦公環境,也用於支付專家薪酬。不出預料,聘請人類專家的成本也在水漲船高。為OpenAI等公司提供專家服務的Labelbox公司透露,目前教授AI操作軟體的生物、軟體程式設計、醫學等不同領域專家中,20%時薪超過90美元,近10%時薪突破120美元。預計未來18個月,頂級專家的時薪將漲至150-250美元。儘管投入巨大,但回報可能超乎想像。一旦成功,這種新訓練方式不僅能幫助OpenAI和Anthropic突破傳統訓練技術的瓶頸,還可能為他們開闢全新的商業模式。例如,未來企業可以銷售能接管使用者電腦並代為操作應用的“AI智能體”,或者利用AI開發出更強大的企業級應用。Anthropic首席執行官達里奧·阿莫代伊(Dario Amodei)將這些AI產品稱為“虛擬協作者”。它們被設計成能與人類並肩工作,熟練操作我們日常使用的各種應用程式。然而,要實現這個目標並不簡單。專門幫助企業最佳化AI模型的圖靈公司(Turing)給出了具體案例。該公司前沿資料項目負責人安舒爾·巴吉(Anshul Bhagi)解釋道,要教會AI完成一個銷售任務,需要跨越多個系統:不僅要掌握Salesforce的客戶篩選功能,還要會使用LinkedIn尋找潛在客戶、用Calendly安排會議,並通過Gmail傳送跟進郵件。圖:研究人員會將複雜任務拆分為多個步驟,然後驗證AI模型是否按要求完成為確保AI真正掌握這些技能,圖靈公司設計了一套精細的驗證流程:將每個任務拆解為多個關鍵步驟,並設立明確的檢查標準。以銷售任務為例,考核標準包括:AI是否按“最後聯絡時間”篩選了客戶資料庫?是否成功傳送包含Calendly會議連結的郵件?是否將潛在客戶狀態更新為“重新接洽”?雖然這項技術尚處於早期階段,但各大AI實驗室已經準備好投入重金。一位投資者透露,Anthropic目前僅將不到10%的後訓練(即模型初步訓練完成後進入最佳化階段)預算用於“強化學習環境”,但由於初期效果顯著,該公司預計明年將大幅提高這方面的投入。AI“訓練場”成為科技巨頭新戰場圖靈公司CEO喬納森·西達爾特(Jonathan Siddharth)近日透露,他們已建成超過1000個強化學習模擬環境,覆蓋從Airbnb到Excel等各類應用場景。這些被稱作“AI健身房”的虛擬空間,正成為訓練AI模型的重要資產。每個模擬環境都配備100到500個定製任務示例,并包含完整的評估體系,讓企業能夠系統性地訓練AI掌握各類辦公技能。這個新興領域正吸引大量玩家入場。Scale、Surge、Mercor和Invisible Technologies等競爭對手紛紛推出類似服務,他們不僅提供模擬環境,還配備行業專家設計各種應用場景下的訓練任務。一批專注服務頂級AI實驗室的初創公司也悄然湧現,強化學習環境正在成為一個新興細分賽道。Surge公司創始人兼CEO埃德溫·陳(Edwin Chen)說:“OpenAI和Anthropic改進模型的方法,其實是在模仿人類的學習過程,而強化學習環境就像是讓AI生活在真實世界裡。”除了搭建模擬環境,AI開發商們也在持續用精心篩選的問答來訓練模型,這些問答往往難度極高,比如頂級的程式設計競賽題或博士水平的生物學問題。這些問答隨後會被用於強化學習,從而教會模型在特定領域的新技能或新知識。圖:改進人工智慧模型的方法,可以比作人類學習新概念的不同途徑隨著AI模型變得越來越聰明,資料標註公司也開始“招兵買馬”,從最初聘請碩博在讀生,升級到聘請在特定領域擁有多年經驗的職場精英。例如,圖靈公司就曾聘請過美國宇航局(NASA)的資料科學家、參與能源部項目的化學家、放射科的住院醫師,甚至還有私募股權公司的副總裁,來完成特定的真實世界任務,讓AI在一旁“觀摩”學習。巴吉舉了一個例子:假設一個AI開發者想教會模型理解稅率變動對財務模型的影響,圖靈公司會先請一位金融專家(合同工)解決這個問題,得出一個明確的答案,比如最終股價,作為檢驗標準。然後,AI開發者會讓模型也去嘗試完成這個任務幾十次。他們會篩選出那些模型計算結果與人類專家一致的案例,再用這些正確的案例來集中訓練模型。通過這種方式,模型開發者能快速、低成本地生成大量正確的訓練樣本。像OpenAI這樣的頭部AI開發商,正試圖從各行各業收集類似的案例,從醫療到法律,無所不包。一位OpenAI的高管在今年早些時候曾私下表示,他們期望“整個經濟體”最終能變成一台巨大的“強化學習機器”。這意味著,AI未來可能會通過記錄各領域專業人士在裝置上的日常工作來進行學習和訓練。 (騰訊科技)
知名VC被騙了5億
這是一個投資人不願看到的騙局。故事主角是一家知名AI創業公司11x.ai(簡稱11x)。早在2022年,年僅24歲的Hasan Sukkar創辦11x,憑藉著推出AI員工聲名鵲起,迅速獲得a16z、Benchmark等知名風投超5億元的融資。然而,造假風波上演。知名科技媒體TechCrunch爆料,“11x一直在宣傳它所沒有的客戶”。簡單說,11x通過宣傳虛假客戶、創新ARR計算方式等途徑,營造業務繁榮的假象。實際上,不少試用客戶反饋產品不盡人意,短暫試用後選擇終止合同。事情仍在調查中。消息稱,11x的B輪領投方a16z可能正在考慮採取法律行動。如此一幕,算是給當下AI創業潮敲響警鐘。01. 90後打造AI員工,融資5個億這要從一位90後創始人說起。哈桑·蘇卡爾(Hasan Sukkar),根據公開資訊可以大致梳理他的成長軌跡:天賦異稟,14歲就建立了一個線上交易平台。2015年,17歲的蘇卡爾因敘利亞難民危機移民到英國,之後進入埃克塞特大學學習工程學。他曾在麥肯錫當過兩年顧問,這段經歷為日後創業埋下伏筆。在蘇卡爾看來,數位化員工將成為全球企業日常工作中不可或缺的一部分。於是在2022年,他帶頭創立了11x,致力於打造可替代人類員工的自動化數字員工。“我們的使命是幫助人們擺脫單調重複的任務,專注於更具創造性和更人性化的任務”。AI熱潮下,11x進展迅速。很快公司推出名為Alice的AI員工,名聲大噪。11x宣稱,Alice是“全球首位數字工作者”,聚焦在銷售領域。相比於傳統的自動化工具,Alice可以自主運行,管理從識別潛在客戶到安排會議的整個外呼銷售流程,無需人工干預。理論上,這將是人類員工無法競爭的對手。畢竟Alice採集了數兆字節的資料和超過5億條線索,從而線上索中整理出最具價值的潛在客戶名單。“她”無所不知、學習速度快,更關鍵的是能做到永不停歇。11x給出一組資料:Alice為銷售團隊預訂的會議數量是人類銷售代表的5倍,價格卻低10倍。很快,投資人找上門了。2023年8月,11x完成200萬美元種子輪融資,由Project A Ventures領投,No Label Ventures、Tiny Ventures以及天使投資人Felipe Navio和Mandeep Singh也參與了此輪融資。隨後,11x又推出另一名AI角色Julian,與Alice共同組成公司兩大產品,為企業提供AI銷售自動化工具。兩“人”分工協作——Alice負責銷售線索的挖掘、研究和客戶拓展。Julian則是一款AI電話銷售代表,能夠使用30多種語言,並能處理與潛在人類買家的來電和去電對話。這是一門想像力巨大的生意,畢竟各行各業都離不開銷售,但過往銷售人員卻要花費長時間在繁瑣的行政工作和資格審查中。如今可以將這類無需動腦卻又必不可少的工作交給數位化員工,讓人類銷售得以解放雙手。於是,11x成為AI圈炙手可熱的創業公司。2024年9月,11x宣佈獲得由Benchmark領投的2400萬美元A輪融資。同月,11x又獲得約5000萬美元的B輪融資,由a16z領投,公司估值約為3.5億美元。至此,創業短短三年,11x迅速累計融資7600萬美元(約合人民幣5.4億元),身後雲集Benchmark、a16z等全球知名VC機構,堪稱AI狂飆時代的一抹寫照。02. 造假風波,90後CEO選擇辭職故事講到這裡,如無意外,11x將成為下一個明星獨角獸。但意外還是發生了。早在今年一季度,一篇調查報導打破了11x光環——據美國科技媒體TechCrunch披露,該公司存在著虛假的客戶宣傳、產品不盡如人意、虛假的ARR計算方式等問題,遠不及表面看到的那樣光鮮。最致命的問題是,11x被爆出造假客戶名單。報導中提到,與許多初創公司一樣,11x在網站上展示一些合作的客戶,然而事實卻是,11x被爆出官網中有多家標記的企業並非公司真正的客戶。具體操作並不複雜。比如一家名為ZoomInfo的企業,曾對11x的AI SDR進行了為期一個月的短期試用,但在發現不如預期後便當即停用,“然而自去年11月以來,11x一直在銷售電話、網站,甚至是其AI撥號器上等多個管道聲稱我們是客戶。”該公司發言人表示。ZoomInfo律師發給11x創始人的電子郵件顯示,11x存在多項法律訴訟理由,“包括但不限於欺騙性貿易行為、商標侵權、盜用商譽和虛假廣告”。與此同時,11x的數字員工噱頭十足,他們的銷售人員經常告訴潛在客戶,由於這家初創公司的技術,客戶可以預期在幾個月內看到會議、演示和電話預約數量大幅增加。但實際銷售結果卻是許多公司在試用後就取消了合作,因為他們對產品不滿意。一家嘗試過該產品的公司表示:“自動傳送的電子郵件數量與預訂的會議數量之間的實際結果令人失望。”對此11x解釋它相信其產品的表現優於人類SDR,“性能最終取決於使用者輸入的質量”,並不保證節省成本或創造收入,這顯然違背了企業借助AI助手的初衷。此外,還有客戶抱怨11x產品讓人產生幻覺,或者根本無法載入。如此種種,將11x引入更為嚴重的風波。他們的行銷方式是,要求希望試用的企業簽署一年期的合同,拒絕提供任何短期試用選項。作為替換方案,11x提供3個月解約條款,也就是說客戶可以在三個月後選擇終止合同,作為一種變相試用機制。但公司在計算年度經常性收入(ARR)時,卻並未區分試用客戶與長期客戶,而是按照全年合同金額計算。這種計算方式下,即使一部分客戶會在試用後流失,公司的業績也會顯得比實際更好。站上風口浪尖,11x創始人蘇卡爾曾發文反駁,否認公司編造財務報表,並強調公司不存在任何財務問題。不過他也承認,文中提到的客戶確實曾付費並試用一段時間後便不再續費。如今,這些客戶的標識已經在11x官網中移除。(11x此前展示的客戶,目前已刪除。來源:TechCrunch)最新一幕是,蘇卡爾選擇辭去公司CEO一職,11x首席技術官Prabhav Jain被任命為公司新任首席執行官。03. AI醞釀史上最大泡沫?警惕FOMO情緒無獨有偶,最近另外一家明星AI公司也陷入爭議。起因是近日,Manus首席科學家季逸超在一場活動上宣佈,公司收入運行率(RRR)達到9000萬美元,瞬間在眾多中英文媒體中形成刷屏級傳播。但很快引起業內質疑——3月上線至今,短短幾個月的時間,一個AI產品的增長勢頭就能達到年收入超6億元人民幣?且Manus用的並非常見的ARR指標,而是RRR,後者通過將一個月的總收入乘以12來得到預測性年度收入。為此,Manus創始人肖弘在社交平台回應。他解釋選擇用RRR資料而非ARR的原因——在他看來,RRR是嚴謹的財務資料,而ARR容易造假:“產品上線初期,很多公司用7天現金收入乘以52來算ARR,這裡包含了年付使用者的現金,可能多出好幾倍。而且產品早期熱度高、嘗鮮者多,很容易高估未來。”不過,這一觀點也對應了11x面臨的問題。實際上,這也是AI創業公司的套路,帳面上看,收入暴增,但實際上使用者並不一定為產品本身買了單,反而導致大量的ARR資料誤導市場。這樣一幕,似曾相識。回想網際網路泡沫時期,公司強調點選量和頁面瀏覽量;移動網際網路時代,下載量和日活成為衡量成功的通用標準。每次技術變革都會催生一批新的“虛榮指標”,如今AI也面臨相似的局面。AI創業火爆,正在締造人類歷史上最大一波創業潮。而FOMO情緒(害怕錯過)渲染下,所有投資人都在問自己:下一個OpenAI在那裡?我會不會錯過?過去兩年,全球AI融資瘋狂歷歷在目,無數年輕創始人被推上財富之巔。但潮水終將會退去。正如一個名為“AI墓地”的網站裡,2025年至今已記錄277個AI工具被關閉。想起幾個月前,知名科技企業Fiverr CEO在公開信中直言,99%的AI創業項目會在一兩年內被淘汰——市場會快速出清,最終留下的,要麼是像OpenAI這樣的底層基礎設施公司,要麼是聚焦垂直場景、真正解決問題的應用層產品。此情此景,為每一位AI創業者敲響警鐘。 (華爾街見聞)
全球95%企業AI慘敗?MIT報告引矽谷恐慌!90%員工偷用ChatGPT續命
【新智元導讀】全球95%企業AI慘遭滑鐵盧?MIT 26頁爆火報告揭開真相:90%員工悄悄用ChatGPT高效辦公,在科技、媒體行業掀起了效率革命。全球95%搞AI項目的公司,基本都涼了!這一驚人的觀點,出自MIT的一份重磅研究報告——「The GenAI Divide: State of AI in Business 2025」。誰曾想,這份令人咋舌的報告,一夜之間刷屏全網。難道AI這麼快就進入寒冬了嗎?事實上,真相遠比各大媒體的標題精彩。在這份26頁報告中,隱藏了一個爆炸性的事實:企業史上最快、最成功的技術應用普及,正在高管們的眼皮底下悄然發生。雖然40%的公司都訂閱了大模型服務,但90%的員工依然會選擇用「個人AI工具」悄悄幹活!一位VC投資人Kasra Khalili一句話道出了真理,「AI並沒有失敗,而是公司內部建構系統的失敗」。報告的核心看點如下:普遍的誤解:新聞頭條緊抓「95%的企業AI試點項目失敗」,但這僅指昂貴、僵化的定製系統。而真相是:90%的員工正積極使用個人AI工具(如ChatGPT)辦公,掀起了一場史上最快的技術普及浪潮。消費級工具完勝企業級:昂貴的企業AI工具因為「死板、無法學習、脫離實際工作流」而被員工拋棄。相反,消費級AI應用則憑藉著靈活性、適應性和即時性大獲全勝。隱藏的生產力爆發:這場自下而上的「革命」帶來了巨大的、未被傳統企業指標計量的生產力提升。最高的回報並非來自光鮮的行銷應用,而是來自無人關注的後台自動化(如客服、文件處理),每年可為企業節省數百萬美元的開支。革命始於員工:報告的結論並非AI失敗,而是企業採購和管理策略的失敗。AI技術本身是成功的,但成功路徑是「從員工到企業」,而非「從企業到員工」。企業應當停止「自建」,轉向「購買」並與供應商深度合作,更重要的是,要向那90%已經找到正確使用方法的員工學習。這背後,究竟揭示了什麼現象?90%員工偷用ChatGPT,自費上班各大科技巨頭AI項目,在內部推行雖然步履維艱,但大多數員工早就在私下「開掛」了。MIT報告指出,「事實上,幾乎每個人都在以某種形式將LLM用於工作中」。其中,90%的員工頻繁地使用個人AI工具,比如ChatGPT、Claude等,那怕是40%公司訂閱了官方服務。換句話說,員工使用AI頻率,是企業採納率的2倍多,這種現象被稱為「影子AI經濟」。最關鍵的是,這些員工並非淺嘗輒止,而是他們在每周的工作中,每天都會多次使用AI。這種普及速度,直接吊打當年電子郵件、智慧型手機、雲端運算的採用頻率。報告中,有個案例太真實了:一家法務公司斥資5萬美元採購了一款專業的AI合同分析工具,但一位律師本人在起草檔案時卻堅持使用ChatGPT。本質原因,就在於AI生成的質量差,顯而易見。這名律師表示,「ChatGPT總能生成更優質的內容,即便我們的供應商聲稱他們用的是同樣的基礎技術」。如今,這一現象,在各行各業普遍存在。就連微軟這樣的巨頭,辦公室員工在家用的都是ChatGPT。一直以來,微軟不論是在公司內部,還是客戶中,大力推行自家的Copilot AI,效果不如人意。去年春天,製藥巨頭Amgen高調官宣引入微軟Copilot後,不過1年,全員紛紛轉向了ChatGPT企業級AI系統脆弱、設計過度,與實際工作流脫節,而消費級AI工具則因靈活性、易用性、即時性,廣受好評。正如一位首席資訊官對研究人員表示,「我們今年看了幾十個產品演示,可能只有一兩個真正有用,其餘的不是華而不實的包裝,就是紙上談兵的科學項目」。當企業高管們還在摸索內部普及AI的門道時,員工們早已破解了「AI的密碼」。斥資5萬美元,自研AI卻敗給了ChatGPT那些登上新聞頭版「95%失敗率」,特指的是,企業委託供應商或內部開發的、昂貴且定製化的企業級AI解決方案。這些工具,之所以推行失敗,核心在於缺乏「學習能力」。報告一針見血,企業級AI無法保存反饋、適應上下文情境,無法隨著時間而改進。直白講,就是太難用了。像ChatGPT這樣的通用AI工具投入生產的成功率為40%,而針對特定任務的企業級工具成功率僅為5%員工們紛紛抱怨,每次都要手動輸入一堆背景資訊,還不會從反饋中學習進步。相較之下,ChatGPT之所以成功,就因為靈活且響應迅速,即便每一次對話都是一次全新的開始。而企業級工具則顯得僵化呆板,每次使用前,都需要進行繁瑣的設定。這種學習能力的差距,在員工使用AI的偏好中,又對應出另一種現象——70%員工在處理郵件、基礎分析等快速任務時,直接找AI而非同事;但對於複雜的、高風險的工作,90%員工更信任人類。這裡的關鍵分界線並非關乎智能的本身,而是AI與人類在記憶與適應能力上的差異。別再自研了,合作成功率翻倍從更深層次看,「影子經濟」並不是AI失敗的證據,反而揭示了,傳統企業指標無法衡量的巨大生產力提升。員工們自行搞定了官方項目的整合難題,恰恰證明了隱藏的生產力。MIT報告稱,「影子經濟」表明,只要能用上靈活、響應迅速的工具,個人完全有能力跨越GenAI應用的鴻溝。一些具備前瞻性思維的公司,已經嗅到了機會。他們努力彌合這一差距,從員工的自發使用中學習,在採購企業級方案前,先分析那些個人工具能真正創造價值。不僅如此,報告還甩出了一個挑戰了傳統的技術觀念:企業應停止嘗試在內部自建AI。資料統計顯示,那些與AI供應商合作的項目,67%能成功部署,而內部自建的只有33%。一個最成功的案例是,那些把AI初創公司當做「業務夥伴」的企業,更注重實際業務成果,需要深度定製和持續改進,而非花哨的產品演示。科技媒體狂飆AI七大行業未被顛覆放眼整個行業,也僅有科技、媒體,因AI發生了顛覆性的結構變革。而醫療、金融、製造在內的七大主要行業,在AI應用實際上「慢半拍」。整體表現為,AI試點頻繁,但內部結構性變化微乎其微。在醫療和能源領域,大多數高管表示,未來5年內沒有裁員計畫,也未預見會裁員。這種審慎的態度並非失敗,而是一種智慧。這些暫未被顛覆的行業,正對AI的實施進行深思熟慮,而不是盲目衝入混亂的變革。科技和媒體行業之所以發展更快,是因為它們能承受更高的風險。超80%高管預計,公司將在24個月內縮減招聘規模。另一個需要注意的點是,企業AI預算中,有一半都砸在了銷售和行銷上。然而,真正賺錢的其實是,那些不起眼的後台自動化項目。比如,通過AI取代外包合同,企業每年能剩下200萬-1000萬美元的客服和文件處理成本,還能砍掉30%外包創意費用。更牛的是,這些收益沒靠裁員實現。AI工具提升了工作效率,但並未改變團隊結構、預算。AI革命正在成功,一次由一名員工推動MIT這份報告,並未證明AI的失敗,恰恰揭示了——AI的成功甚至已超出了企業的預期,員工早已走在了僱主的前面。技術本身沒有問題,問題出在企業的採購和管理方式上。那些能跨越GenAI鴻溝的公司,共同點是,加以利用能深度融合、不斷最佳化的工具。至於那95%沒搞成的企業AI試點,其實報告已經指出了一條明路:跟著90%已摸透AI門道的員工學習。Contextual AI創始人認為,GenAI項目失敗根本原因不在模型,而是上下文重要性被忽視一位製造業高管表示,「我們處理某些合同的速度是變快了,但僅此而已」。顯然,他未能看到全域。處理合同的速度加快,當這一改進乘以數百萬員工和成千上萬的日常任務時,不就是最後大爆發的生產力?總言之,AI革命沒有失敗,它正在每一次的ChatGPT對話中,悄然取得成功。上市公司暴省兆美元另一份來自摩根士丹利報告,也從側面印證了AI革命並未失敗的觀點。其中的一項分析稱,由AI帶來的顛覆性變革,或能為標普500公司每年節省9200億美元的成本——相當於總薪酬的41%,或2026年稅前利潤的28%。而這個過程,將通過削減薪酬開支(裁員、自然流失、自動化)來實現。報告的核心觀點如下:預計90%的工作崗位會受到AI自動化或功能增強的影響。AI智能體將重塑工作任務,而人形機器人將在物流、零售等領域直接替代人工。每年近兆的效益,最終有望轉化為13兆至16兆美元的市值增長,相當於其當前總市值的近1/4。AI已不再是一個投機概念,而是驅動未來十年企業盈利增長的核心引擎。首先,在AI的衝擊下,不同行業受到的影響程度也會有所不同。比如日常消費品的分銷與零售、房地產管理以及交通運輸業是受衝擊最大的幾個行業。其中,由AI驅動的潛在生產力提升,預計將超過2026年預測收益的100%。但對於半導體和硬體行業等,人力成本相對於其盈利而言佔比較低的行業,可挖掘的AI價值潛力則相對較低。其次,「完全自動化」與「任務級增強」之間,還是有區別的。簡單來說就是,軟體應用中的AI智能體的作用,更傾向於重新分配任務,而非徹底取消崗位。相比之下,以人形機器人形態出現的具身智能,則在物流和實體零售等行業構成了更直接的替代風險。報告同時預測,在崗位替代的趨勢下,全新的職位類別也將應運而生——從首席AI官(Chief AI Officer)到AI治理專家不一而足。這與早期技術顛覆浪潮中,市場對程式設計師、IT專家和數字行銷人員的需求激增如出一轍。最後,分析師還指出,AI的全面普及可能需要數年甚至數十年的時間。企業初期的重點將是依賴人員的自然流失和提升流程效率,而非立即進行大規模裁員,尤其是在那些由面向客戶的崗位驅動收入的行業。AI革命的浪潮已至,總的來說,無論是從麻省理工學院深入一線的微觀洞察,還是來自摩根士丹利高瞻遠矚的宏觀分析,都指向了一個共同的結論——AI革命的浪潮已至,學習並擁抱那些靈活、高效的AI工具,將會幫助你抓住這價值數兆美元的時代機遇。 (新智元)
小扎“挖人”超級智能團隊名單洩露:華人佔一半,Alexandr Wang領導
據報剛剛小紮在一份內部備忘錄中,正式向員工介紹了其新組建的“超級智能”團隊20幾名成員,名單和簡歷顯示,許多新入職的員工都來自AI領域的頂尖對手公司,其中華人佔了快一半了整個組織命名為Meta超級智能實驗室(MSL),包括所有的基礎模型、產品和FAIR團隊,以及一個專注於開發下一代模型的新實驗室小扎向Scale AI投資了143億美元,並聘請Scale AI CEO Alexandr Wang將擔任公司的“首席AI官”並領導MSL。同時,前GitHub CEO Nat Friedman將與Wang共同領導這個新實驗室,專注於AI產品和應用研究小扎這一把砸下上百億美金,真是下血本了,這其實也是Deepseek的威力,因為R1徹底顛覆了Meta的 llama開源模型名單以下是Zuckerberg備忘錄中公佈的新員工名單。值得注意的是,這份名單並未包括從OpenAI蘇黎世辦公室加入的員工其中四名OpenAI華人頂尖研發領導,詳細請看我之前的文章(突發!小扎“突襲”OpenAI核心,四名頂尖華人被挖走)Shuchao Bi: GPT-4o語音模式和o4-mini的共同創造者。此前在OpenAI領導多模態後訓練團隊Hongyu Ren: GPT-4o、4o-mini、o1-mini、o3-mini、03和o4-mini的共同創造者。此前在OpenAI領導一個負責後訓練的小組Jiahui Yu: 03、04-mini、GPT-4.1和GPT-4o的共同創造者。此前在OpenAI領導感知團隊,並在Gemini共同領導多模態團隊Shengjia Zhao: ChatGPT、GPT-4、所有mini模型、4.1和03的共同創造者。此前在OpenAI領導合成資料團隊除了以上四名華人以外,今天的名單上新增加了三位華人Ji Lin: 幫助建構了03/o4-mini、GPT-4o、GPT-4.1、GPT-4.5、40-imagegen以及Operator推理棧本科清華,PhD 麻省理工,2023年11月加入OpenAI,主要研究方向是多模態、推理、合成資料Pei Sun: 在Google Deepmind負責Gemini的後訓練、編碼和推理工作。此前曾創造了Waymo最近兩代的感知模型本科清華,Master美國卡內基梅隆大學,PhD退學 ,是Gemini 後期訓練、思考和編碼的核心貢獻者。發明了許多核心方案。參與了 Gemini 1、1.5、2、2.5 的開發Huiwen Chang: GPT-4o圖像生成的共同創造者,此前在Google研究院發明了MaskIT和Muse文生圖架構本科清華,PhD普林斯頓大學,2023年6月加入OpenAI,曾在Google工作6年多這是爆出來的其他名單Trapit Bansal: 在OpenAI開創了思維鏈上的強化學習(RL),並且是o系列模型的共同創造者Joel Pobar: 在Anthropic負責推理工作。此前曾在Meta工作11年,負責過HHVM、Hack、Flow、Redex、性能工具和機器學習等項目Jack Rae: Gemini的預訓練技術負責人,並負責Gemini 2.5的推理工作。曾在DeepMind領導了Gopher和Chinchilla等早期大語言模型項目Johan Schalkwyk: 前GoogleFellow,Sesame項目的早期貢獻者,以及Maya項目的技術負責人寫在最後看起來,小扎組建的超級智能實驗室創始團隊裡華人幾乎佔了快一半了,我們最後再來個梳理Alexandr Wang:Scale AI創始人,領導超級智能團隊Shuchao Bi:本科浙大,博士加州伯克利分校Hongyu Ren:本科北大,博士史丹佛大學Jiahui Yu:本科中科大,博士美國伊利諾伊大學香檳分校Shengjia Zhao:本科清華,博士史丹佛大學Ji Lin:本科清華,博士麻省理工學院Pei Sun:本科清華,碩士卡內基梅隆大學Huiwen Chang:本科清華,博士普林斯頓大學Xiaohua Zhai(翟曉華):本科南京大學,博士北大,OpenAI瑞士蘇黎世辦公室 (AI寒武紀)
黃仁勳:未來我將擁有 1 億 AI 員工
在全球AI浪潮中,黃仁勳領導的NVIDIA是核心推動者之一。在人工智慧和晶片設計領域,NVIDIA不僅維持著絕對的領先地位,還不斷擴大其市場影響力。最近,黃仁勳在接受採訪時,勾畫了NVIDIA未來的宏偉願景。他希望公司的員工數量從目前的1.2萬名增至5萬名,同時擁有1億名AI助手來輔助公司各個部門的運作。這一願景不僅展現了黃仁勳對AI技術的深厚信心,也體現了他對AI未來發展的大膽預期。 1億AI助手的普及與應用場景 黃仁勳提出的1億AI助手願景,絕非僅是未來藍圖,而是公司內部生產力提升的實際引擎。AI助手的廣泛應用將涵蓋NVIDIA公司內部的各個部門,從晶片設計到網路安全、再到軟體開發,幾乎無處不在。這些AI助手的核心作用在於將複雜的任務分解成多個子步驟,每個步驟由AI助手處理特定部分,顯著提升工作效率。例如,在晶片設計過程中,AI助手可以首先幫助進行設計草圖的生成,隨後在具體參數設定和性能測試環節各自分工,從而加速整個設計流程。黃仁勳還特別提到,他每天都會使用AI工具,比如ChatGPT這樣的生成式AI,以提升他的日常工作效率,這一切都表明AI已經深刻融入了NVIDIA的日常運作。 事實上,NVIDIA早已在大規模應用AI助手技術,公司內部的多個項目中已經部署了自動化系統和智能演算法。黃仁勳指出,這些AI助手不僅能夠在單個任務上協同人類員工,還能實現彼此之間的合作,甚至自主招募其他AI來處理更複雜的問題。這一特性意味著未來的AI助手將不再是簡單的自動化工具,而是具備自主學習與協作能力的智能體。